home *** CD-ROM | disk | FTP | other *** search
/ Aminet 41 / Aminet 41 (2001)(Schatztruhe)[!][Feb 2001].iso / Aminet / dev / c / libiconv_src.lha / src / gb18030ext.h < prev    next >
Encoding:
C/C++ Source or Header  |  2000-11-07  |  9.6 KB  |  216 lines

  1.  
  2. /*
  3.  * GB18030 two-byte extension
  4.  */
  5.  
  6. static const unsigned short gb18030ext_2uni_pagea9[13] = {
  7.   /* 0xa9 */
  8.   0xfffd, 0x2ff0, 0x2ff1, 0x2ff2, 0x2ff3, 0x2ff4, 0x2ff5, 0x2ff6,
  9.   0x2ff7, 0x2ff8, 0x2ff9, 0x2ffa, 0x2ffb,
  10. };
  11. static const unsigned short gb18030ext_2uni_pagefe[95] = {
  12.   /* 0xfe */
  13.   0xfffd, 0xfffd, 0xfffd, 0xfffd, 0xfffd, 0xfffd, 0xfffd, 0xfffd,
  14.   0xfffd, 0xfffd, 0xfffd, 0xfffd, 0xfffd, 0xfffd, 0xfffd, 0xfffd,
  15.   0x2e81, 0xfffd, 0xfffd, 0xfffd, 0x2e84, 0x3473, 0x3447, 0x2e88,
  16.   0x2e8b, 0xfffd, 0x359e, 0x361a, 0x360e, 0x2e8c, 0xfffd, 0x396e,
  17.   0x3918, 0xfffd, 0x39cf, 0x39df, 0x3a73, 0x39d0, 0xfffd, 0xfffd,
  18.   0x3b4e, 0x3c6e, 0x3ce0, 0x2ea7, 0xfffd, 0xfffd, 0x2eaa, 0x4056,
  19.   0x415f, 0x2eae, 0x4337, 0x2eb3, 0x2eb6, 0x2eb7, 0xfffd, 0x43b1,
  20.   0x43ac, 0x2ebb, 0x43dd, 0x44d6, 0x4661, 0x464c, 0xfffd, 0x4723,
  21.   0x4729, 0x477c, 0x478d, 0x2eca, 0x4947, 0x497a, 0x497d, 0x4982,
  22.   0x4983, 0x4985, 0x4986, 0x499f, 0x499b, 0x49b7, 0x49b6, 0xfffd,
  23.   0xfffd, 0x4ca3, 0x4c9f, 0x4ca0, 0x4ca1, 0x4c77, 0x4ca2, 0x4d13,
  24.   0x4d14, 0x4d15, 0x4d16, 0x4d17, 0x4d18, 0x4d19, 0x4dae,
  25. };
  26.  
  27. static int
  28. gb18030ext_mbtowc (conv_t conv, wchar_t *pwc, const unsigned char *s, int n)
  29. {
  30.   unsigned char c1 = s[0];
  31.   if ((c1 == 0xa2) || (c1 >= 0xa8 && c1 <= 0xa9) || (c1 == 0xfe)) {
  32.     if (n >= 2) {
  33.       unsigned char c2 = s[1];
  34.       if ((c2 >= 0x40 && c2 < 0x7f) || (c2 >= 0x80 && c2 < 0xff)) {
  35.         unsigned int i = 190 * (c1 - 0x81) + (c2 - (c2 >= 0x80 ? 0x41 : 0x40));
  36.         unsigned short wc = 0xfffd;
  37.         if (i < 7410) {
  38.           if (i == 6432)
  39.             wc = 0x20ac;
  40.         } else if (i < 23750) {
  41.           if (i == 7536)
  42.             wc = 0x01f9;
  43.           else if (i >= 7672 && i < 7685)
  44.             wc = gb18030ext_2uni_pagea9[i-7672];
  45.         } else {
  46.           if (i < 23845)
  47.             wc = gb18030ext_2uni_pagefe[i-23750];
  48.         }
  49.         if (wc != 0xfffd) {
  50.           *pwc = (wchar_t) wc;
  51.           return 2;
  52.         }
  53.       }
  54.       return RET_ILSEQ;
  55.     }
  56.     return RET_TOOFEW(0);
  57.   }
  58.   return RET_ILSEQ;
  59. }
  60.  
  61. static const unsigned short gb18030ext_page2e[80] = {
  62.   0x0000, 0xfe50, 0x0000, 0x0000, 0xfe54, 0x0000, 0x0000, 0x0000, /*0x80-0x87*/
  63.   0xfe57, 0x0000, 0x0000, 0xfe58, 0xfe5d, 0x0000, 0x0000, 0x0000, /*0x88-0x8f*/
  64.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x90-0x97*/
  65.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x98-0x9f*/
  66.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe6b, /*0xa0-0xa7*/
  67.   0x0000, 0x0000, 0xfe6e, 0x0000, 0x0000, 0x0000, 0xfe71, 0x0000, /*0xa8-0xaf*/
  68.   0x0000, 0x0000, 0x0000, 0xfe73, 0x0000, 0x0000, 0xfe74, 0xfe75, /*0xb0-0xb7*/
  69.   0x0000, 0x0000, 0x0000, 0xfe79, 0x0000, 0x0000, 0x0000, 0x0000, /*0xb8-0xbf*/
  70.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xc0-0xc7*/
  71.   0x0000, 0x0000, 0xfe84, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xc8-0xcf*/
  72. };
  73. static const unsigned short gb18030ext_page2f[16] = {
  74.   0xa98a, 0xa98b, 0xa98c, 0xa98d, 0xa98e, 0xa98f, 0xa990, 0xa991, /*0xf0-0xf7*/
  75.   0xa992, 0xa993, 0xa994, 0xa995, 0x0000, 0x0000, 0x0000, 0x0000, /*0xf8-0xff*/
  76. };
  77. static const unsigned short gb18030ext_page34[56] = {
  78.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe56, /*0x40-0x47*/
  79.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x48-0x4f*/
  80.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x50-0x57*/
  81.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x58-0x5f*/
  82.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x60-0x67*/
  83.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x68-0x6f*/
  84.   0x0000, 0x0000, 0x0000, 0xfe55, 0x0000, 0x0000, 0x0000, 0x0000, /*0x70-0x77*/
  85. };
  86. static const unsigned short gb18030ext_page36[24] = {
  87.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe5c, 0x0000, /*0x08-0x0f*/
  88.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x10-0x17*/
  89.   0x0000, 0x0000, 0xfe5b, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x18-0x1f*/
  90. };
  91. static const unsigned short gb18030ext_page39[24] = {
  92.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe62, /*0xc8-0xcf*/
  93.   0xfe65, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xd0-0xd7*/
  94.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe63, /*0xd8-0xdf*/
  95. };
  96. static const unsigned short gb18030ext_page43[56] = {
  97.   0x0000, 0x0000, 0x0000, 0x0000, 0xfe78, 0x0000, 0x0000, 0x0000, /*0xa8-0xaf*/
  98.   0x0000, 0xfe77, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xb0-0xb7*/
  99.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xb8-0xbf*/
  100.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xc0-0xc7*/
  101.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xc8-0xcf*/
  102.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xd0-0xd7*/
  103.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe7a, 0x0000, 0x0000, /*0xd8-0xdf*/
  104. };
  105. static const unsigned short gb18030ext_page46[32] = {
  106.   0x0000, 0x0000, 0x0000, 0x0000, 0xfe7d, 0x0000, 0x0000, 0x0000, /*0x48-0x4f*/
  107.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x50-0x57*/
  108.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x58-0x5f*/
  109.   0x0000, 0xfe7c, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x60-0x67*/
  110. };
  111. static const unsigned short gb18030ext_page47_1[16] = {
  112.   0x0000, 0x0000, 0x0000, 0xfe80, 0x0000, 0x0000, 0x0000, 0x0000, /*0x20-0x27*/
  113.   0x0000, 0xfe81, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x28-0x2f*/
  114. };
  115. static const unsigned short gb18030ext_page47_2[24] = {
  116.   0x0000, 0x0000, 0x0000, 0x0000, 0xfe82, 0x0000, 0x0000, 0x0000, /*0x78-0x7f*/
  117.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x80-0x87*/
  118.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe83, 0x0000, 0x0000, /*0x88-0x8f*/
  119. };
  120. static const unsigned short gb18030ext_page49[120] = {
  121.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe85, /*0x40-0x47*/
  122.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x48-0x4f*/
  123.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x50-0x57*/
  124.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x58-0x5f*/
  125.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x60-0x67*/
  126.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x68-0x6f*/
  127.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x70-0x77*/
  128.   0x0000, 0x0000, 0xfe86, 0x0000, 0x0000, 0xfe87, 0x0000, 0x0000, /*0x78-0x7f*/
  129.   0x0000, 0x0000, 0xfe88, 0xfe89, 0x0000, 0xfe8a, 0xfe8b, 0x0000, /*0x80-0x87*/
  130.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x88-0x8f*/
  131.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x90-0x97*/
  132.   0x0000, 0x0000, 0x0000, 0xfe8d, 0x0000, 0x0000, 0x0000, 0xfe8c, /*0x98-0x9f*/
  133.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xa0-0xa7*/
  134.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0xa8-0xaf*/
  135.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe8f, 0xfe8e, /*0xb0-0xb7*/
  136. };
  137. static const unsigned short gb18030ext_page4c[56] = {
  138.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe96, /*0x70-0x77*/
  139.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x78-0x7f*/
  140.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x80-0x87*/
  141.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x88-0x8f*/
  142.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x90-0x97*/
  143.   0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0xfe93, /*0x98-0x9f*/
  144.   0xfe94, 0xfe95, 0xfe97, 0xfe92, 0x0000, 0x0000, 0x0000, 0x0000, /*0xa0-0xa7*/
  145. };
  146. static const unsigned short gb18030ext_page4d[16] = {
  147.   0x0000, 0x0000, 0x0000, 0xfe98, 0xfe99, 0xfe9a, 0xfe9b, 0xfe9c, /*0x10-0x17*/
  148.   0xfe9d, 0xfe9e, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000, /*0x18-0x1f*/
  149. };
  150.  
  151. static int
  152. gb18030ext_wctomb (conv_t conv, unsigned char *r, wchar_t wc, int n)
  153. {
  154.   if (n >= 2) {
  155.     unsigned short c = 0;
  156.     if (wc == 0x01f9)
  157.       c = 0xa8bf;
  158.     else if (wc == 0x20ac)
  159.       c = 0xa2e3;
  160.     else if (wc >= 0x2e80 && wc < 0x2ed0)
  161.       c = gb18030ext_page2e[wc-0x2e80];
  162.     else if (wc >= 0x2ff0 && wc < 0x3000)
  163.       c = gb18030ext_page2f[wc-0x2ff0];
  164.     else if (wc >= 0x3440 && wc < 0x3478)
  165.       c = gb18030ext_page34[wc-0x3440];
  166.     else if (wc == 0x359e)
  167.       c = 0xfe5a;
  168.     else if (wc >= 0x3608 && wc < 0x3620)
  169.       c = gb18030ext_page36[wc-0x3608];
  170.     else if (wc == 0x3918)
  171.       c = 0xfe60;
  172.     else if (wc == 0x396e)
  173.       c = 0xfe5f;
  174.     else if (wc >= 0x39c8 && wc < 0x39e0)
  175.       c = gb18030ext_page39[wc-0x39c8];
  176.     else if (wc == 0x3a73)
  177.       c = 0xfe64;
  178.     else if (wc == 0x3b4e)
  179.       c = 0xfe68;
  180.     else if (wc == 0x3c6e)
  181.       c = 0xfe69;
  182.     else if (wc == 0x3ce0)
  183.       c = 0xfe6a;
  184.     else if (wc == 0x4056)
  185.       c = 0xfe6f;
  186.     else if (wc == 0x415f)
  187.       c = 0xfe70;
  188.     else if (wc == 0x4337)
  189.       c = 0xfe72;
  190.     else if (wc >= 0x43a8 && wc < 0x43e0)
  191.       c = gb18030ext_page43[wc-0x43a8];
  192.     else if (wc == 0x44d6)
  193.       c = 0xfe7b;
  194.     else if (wc >= 0x4648 && wc < 0x4668)
  195.       c = gb18030ext_page46[wc-0x4648];
  196.     else if (wc >= 0x4720 && wc < 0x4730)
  197.       c = gb18030ext_page47_1[wc-0x4720];
  198.     else if (wc >= 0x4778 && wc < 0x4790)
  199.       c = gb18030ext_page47_2[wc-0x4778];
  200.     else if (wc >= 0x4940 && wc < 0x49b8)
  201.       c = gb18030ext_page49[wc-0x4940];
  202.     else if (wc >= 0x4c70 && wc < 0x4ca8)
  203.       c = gb18030ext_page4c[wc-0x4c70];
  204.     else if (wc >= 0x4d10 && wc < 0x4d20)
  205.       c = gb18030ext_page4d[wc-0x4d10];
  206.     else if (wc == 0x4dae)
  207.       c = 0xfe9f;
  208.     if (c != 0) {
  209.       r[0] = (c >> 8); r[1] = (c & 0xff);
  210.       return 2;
  211.     }
  212.     return RET_ILSEQ;
  213.   }
  214.   return RET_TOOSMALL;
  215. }
  216.